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摘 要 : 天 体 光 谱 数据 的 智能 处 理 正 由 传统 机 器 学 习 方 法 逐步 转向 深度 学 习 ,主要 采用 
基于 计算 机 视觉 的 技术 手段 。 本 文 基 于 在 计算 机 视觉 领域 广泛 应 用 的 DenseNet 网 络 结 
针对 光谱 数据 进行 修改 ,建立 了 适用 于 光谱 数据 的 一 维 着 积 神经 网 络 模型 解决 天 体 光 谱 数 据 
分 类 任务 。 在 验证 数据 集 上 ,恒星 、 星系 .类 星体 的 Fl 分 数 达 到 了 为 0.9987, 0.9127, 0.9147 , 
高 于 传统 神经 网 络 。 光 谱 分 类 关注 区 域 的 可 视 化 结果 表明 ,本 文 模 型 可 以 学 习 到 各 类 天 体 对 
应 的 特征 谱 线 ,具有 较 强 的 可 解释 性 。 本 文 的 方法 被 用 于 阿里 云天 池 天 文 数 据 挖掘 大 赛 一 一 
天 体 光谱 智能 分 类 ， 并 在 843 支 参赛 队伍 的 3 次 数据 评比 中 获得 了 2 次 第 一 、1 次 第 三 的 成 
绩 ,证 明了 该 模型 在 保证 分 类 精度 的 同时 县 有 极 强 的 鲁 棒 性 、 泛 化 性 , 适用 于 光谱 的 自动 分 
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随 着 科学 技术 的 发 展 和 观测 设备 不 断 升级 , 天 文 数据 呈现 爆炸 式 的 增长 。 人 工 智 能 CAT) 
技术 能 够 辅助 天 文学 家 们 处理 分 析 海 量 天 文 数据 , 发 现 新 的 特殊 天 体 和 物理 规律 。 天体 光 谱 
数据 的 智能 处 理 正 由 传统 机 器 学 习 方 法 逐步 转向 深度 学 习 '" ,主要 采用 基于 计算 机 视觉 的 
技术 手段 。 参 考 文献 [1] 提 出 了 使 用 5 层 卷 积 神经 网 络 估 计 大 气 参数 的 方法 。 参 考 文献 [2] 提 
出 使 用 自 编码 算法 的 神经 网 络 对 斯 隆 数字 巡天 (SDSS ) 光 谱 进行 恒星 大 气 物理 参数 的 估计 。 
参考 文献 [3] 提 出 使 用 深度 神经 网 络 模型 并 构造 分 类 器 对 光谱 进行 分 类 。 深 度 学 习 方法 较 机 
器 学 习 在 处 理 天 体 光 谱 数据 上 的 精度 、 重 棒 性 和 泛 化 性 都 有 明显 提升 。 
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郭守敬 望远镜 (LAMOST， 大 天 区 面积 多 目标 光纤 光谱 天 文 望 远 镜 ) 是 一 架 新 类 型 的 大 
视 场 兼备 大 口径 望远镜 , 在 大 规模 光学 光谱 观测 和 大 视 场 天 文学 研究 方面 , 居于 国际 领先 的 
地 位 。LAMOST 是 世界 上 光谱 获取 率 最 高 的 望远镜 ， 每 个 观测 夜晚 能 采集 万 余 条 光谱 。 截 
1E LAMOST DATA RELEASE 5 v1, 已 产生 900 万 以 上 条 光谱 。 光 谱 类 别 的 划分 是 所 有 天 文 
研究 的 前 提 ， 正 确 的 分 类 可 以 减少 天 文学 家 对 数据 的 筛选 、 清 洗 工作 ， 同 时 可 以 提高 

LAMOST 数据 的 使 用 效率 。 光 谱 自 动 分 类 是 从 上 干 维 的 光谱 数据 中 选择 和 提取 对 分 类 识别 
最 有 效 的 特征 来 构建 特征 空间 。 天体 光谱 与 其 类 别 之 间 的 关系 是 高 度 非 线 性 的 , 实际 观测 中 
又 存在 大 量 观 测 来 自 仪器 、 天 气 方面 的 噪声 。 传 统 的 机 器 学 习 与 模板 匹配 方法 在 非 线 性 关系 
的 探索 上 表现 不 佳 , 而 深度 学 习 在 非 线性 关系 探索 和 表示 方面 有 着 天 然 的 优势 , 理论 上 高 深 
度 的 神经 网 络 可 以 拟 合 任意 复杂 的 关系 函数 。 
因此 , 本 文 基于 LAMOST 光谱 数据 特点 对 DenseNet 中 网 络 结构 进行 优化 ,并 利用 优化 后 
> 的 模型 结构 对 光谱 数据 进行 分 类 训练 与 检测 ， 提 出 了 基于 DenseNet 的 LAMOST 光谱 自动 
分 类 处 理 方法 。 本 方法 被 用 于 阿里 云天 池 天 文 数据 挖掘 大 赛 一 一 天 体 光谱 智能 分 类 ， 并 在 
843 支 参赛 队伍 的 3 次 数据 评比 中 获得 了 2 次 第 一 、1 次 第 三 的 成 绩 ， 证 明了 该 模型 在 保证 
分 类 精度 的 同时 具有 极 强 的 鲁 棒 性 、 泛 化 性 ， 适 用 于 光谱 的 自动 分 类 


2， 数 据 集 以 及 类 别 


本 文 数据 集 选 取 自 国家 天 文 与 阿里 云天 池 主 办 的 “天 文 数据 挖掘 大 赛 ” 发 布 的 LAMOST 
光谱 数据 !， 共 449384 条 。 随 机 抽取 其 中 89877 条 光谱 作为 验证 集 数 据 ， 其 余 作 为 原始 的 训 
练 数据 。 海量 不 同 但 是 具有 同一 类 别 的 光谱 数据 ， 可 以 显著 的 提高 模型 的 泛 化 能 力 ， 同 时 使 
模型 在 验证 数据 集 上 拥有 很 强 的 适应 性 。 

LAMOST 数据 集中 的 每 一 条 光谱 提供 了 3690 一 9100 埃 的 波长 范围 内 的 一 系列 辐射 强度 
值 。 该 竞赛 是 纯粹 的 数据 挖掘 比赛 ， 光 谱 数 据 不 含 波长 信息 ， 但 所 有 光谱 数据 的 波段 区 间 和 
采样 点 相同 ， 采 样 点 个 数 都 是 2600 个 。 

在 目前 的 LAMOST 巡天 数据 发 布 中 , 光谱 主要 被 分 为 恒星 (STAR)、 星 系 (GALAXY)、 
类 星体 (QSO) 和 未 知 CUNKNOWN) 天 体 四 大 类 ， 本 文 仅 对 恒星 、 星 系 和 类 星体 三 


体 光 谱 进行 分 类 。 


3， 分 类 模型 


1 天 文 数 据 挖 掘 大 赛 : https://tianchi.aliyun.com/competition/entrance/231646/information 
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天 体 光谱 数据 是 天 体 的 点 源 光 经 过 色散 形成 的 、 分 布 在 不 同 波 长 下 流量 强度 的 序列 。 根 
据 其 吸收 线 、 发 射线 的 位 置 、 强 弱 、 宽 度 等 性 质 ， 天 文学 家 可 以 判断 该 天 体 的 所 属 类 别 。 可 
以 说 天 体 光 谱 的 在 一 维 坐标 系 下 的 “样子 ”决定 了 它 的 类 别 ， 这 种 “样子 ” 决定“ 类别” 的 
任务 天 然 适 合 于 卷 积 神经 网 络 。 传 统 的 卷 积 神经 网 络 预 训练 模型 都 是 针对 二 维 图 像 数 据 构建 
并 训练 得 到 的 ， 并 不 适用 于 一 维 天 体 光 谱 数 据 。 为 此 ,我 们 基于 在 计算 机 视觉 领域 广泛 应 用 
的 DenseNet 网 络 结构 ， 针 对 光谱 数据 进行 修改 ， 建 立 了 适用 于 光谱 数据 的 一 维 卷 积 神经 网 
络 模型 解决 天 体 光 谱 数 据 分 类 任务 。 网 络 模型 结构 如 图 1 。 网 络 模型 通过 N+1 个 Dense Block 
结构 依次 连接 ， 在 Dense Block 中 采用 密集 型 连接 结构 解决 深层 网 络 带 来 的 梯度 弥散 问题 。 
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图 1 本 文 使 用 的 深度 神经 网 络 结构 。 蓝 色 框 中 是 Dense Block 结构 。 黄 色 框 中 是 Transition Block 结构 。 输 入 数据 依次 通 


it N+1 个 Dense Block 并 得 到 新 的 特征 ， 最 终 输 出 对 输入 光谱 的 预测 。 


Fig.1 The structure of deep neural network in this paper. The blue box represented the Dense Block structure. The yellow box 
represented the Transition Block structure. The input data flowed through N+1 Dense Block in turn to generate new feature maps, and 


subsequently the prediction result was generated. 
数据 流 的 处 理 过 程 为 ， 归 一 化 后 的 光谱 数据 经 过 卷 积 层 后 进入 Dense Block 结构 ， 经 过 
N+1 次 Dense Block 的 特征 提取 得 到 高 维特 征 图 ， 随 后 对 每 个 高 维特 征 图 进行 全 局 平均 ， 平 
均 后 的 值 再 经 过 全 连接 层 输出 该 光谱 所 属 类 别 的 概率 预测 值 。 
除 最 后 一 个 Dense Block 4}, 所 有 Dense Block 后 都 会 连接 一 个 卷 积 层 和 一 个 池 化 层 。 二 
者 的 目的 都 是 为 了 减少 计算 量 , 卷 积 层 从 数据 维度 上 减低 计算 量 , 池 化 层 从 数据 尺度 上 降低 
计算 量 , 这 两 层 的 连接 记 为 Transition Block. 但 是 池 化 层 通过 将 两 个 相 邻 的 数据 点 平均 成 一 
个 数据 点 ， 将 原始 数据 的 尺度 变 成 了 原来 的 一 半 ， 使 得 不 同 尺 度 下 Dense Block 间 不 能 再 进 
行 密集 型 的 连接 。 为 了 进一步 增强 不 同 尺 度 下 特征 的 联系 和 重用 ， 我 们 对 原 DenseNet 结构 
进行 改进 , 在 两 个 Transition Block 间 增 加 了 额外 的 Transition Block 跨 层 连 接 , 如 图 2 所 示 。 
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图 2 两 个 Transition Block 间 额 外 的 Transition Block. 
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Fig.2 Additional transition blocks between two transition blocks. Additional transition block enhances the connection and reuse of 


Dense Block 通过 Conv Block 密集 型 连接 构成 , 如 


feature maps at different scales. 


图 3。 密集 型 连接 使 得 在 同一 个 Dense 


Block 中 ， 所 有 卷 积 层 的 输入 来 源 于 前 面 所 有 层 的 输出 ， 加 强 了 不 同 特征 间 的 联系 ， 也 缓解 


了 深度 神经 网 络 在 训练 时 会 遇 到 的 梯度 弥散 问题 。 


在 本 试验 中 ， 我 们 使 用 2 个 Conv Block 


连接 。 更 少 的 Conv Block 使 分 类 精度 下 降 ， 更 多 的 Conv Block 不 仅 不 会 带 来 更 高 的 精度 提 


升 ， 而 且 会 使 计算 量 急剧 增加 。 
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图 3 Dense Block 


Fig.3 Dense Block 


Conv Block 作为 具体 的 特 生 


提取 结构 ， 需 要 针对 输入 数据 进行 针对 性 的 构建 。 本 文 使 
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用 的 天 体 光 谱 数 据 具有 发 射线 吸收 线 等 物理 特征 , 由 于 这 些 元 素 的 谱 线 宽度 、 位 置 不 确定 ， 
我 们 使 用 多 个 卷 积 步 长 (1、11、25、41) 的 卷 积 层 分 别 对 输入 的 数据 进行 卷 积 ， 将 得 到 的 
不 同 卷 积 尺度 下 的 卷 积 结果 合并 到 一 起 后 , 使 用 卷 积 步 长 为 1 的 卷 积 层 进行 不 同 卷 积 尺度 下 
的 整合 ， 如 图 4， 使 得 神经 网 络 模 型 可 以 对 元 素 谱 线 进行 更 好 的 适应 与 学 习 。 其 中 批 归 一 化 
(Batch normalization) Di 一 特征 重 标定 结构 〈Squeeze-and-Excitation block) © 一 修正 线性 
单元 (Rectified Linear Unit) 中 依次 连接 的 处 理 加 在 了 每 一 次 卷 积 层 前 。 批 归 一 化 和 修正 线 
性 单元 都 是 为 了 进一步 缓解 深度 神经 网 络 在 训练 时 遇 到 的 梯度 弥散 文 题 。 
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图 4 conv block。 合 并 多 个 卷 积 尺度 C, 11, 25, 41) 下 的 特征 图 ， 并 抽取 新 的 特征 。 


Fig.4 Conv block. The new feature maps are generated by extracting merged feature maps which convoluted from multiple scales (1, 11, 
25 and 41), 
卷 积 层 前 的 特征 重 标定 结构 会 使 神经 网 络 模型 对 产生 的 新 特征 进行 再 次 选择 。 这 个 “ 选 
择 ” 的 过 程 通 过 对 原始 特征 赋 权 重 实现 ,通过 学 习 的 方式 来 自动 获取 到 每 个 特征 的 重要 程度 ， 
然后 依照 这 个 重要 程度 去 提升 有 用 的 特征 ， 并 抑制 对 光谱 分 类 任务 用 处 不 大 的 特征 。 具体 的 
实现 方式 如 图 5。 原 始 特 征 图 通过 全 局 平局 池 化 转换 为 点 向 量 ， 随 后 通过 全 连接 层 ， 输 出 每 
个 特征 图 对 应 的 权重 ， 最 后 将 原始 特征 图 与 该 权重 相 乘 ， 输 出 加 权 后 的 新 特征 图 。 
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图 5 SE block。 原 始 特征 图 通过 全 局 平均 池 化 和 全 连接 后 产生 对 应 的 权重 。 原 始 特征 与 该 权重 相 乘 后 输出 新 的 特征 图 。 
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Fig.5 SE block. The feature maps generated corresponding weight through global average pooling and full connection 


The new feature maps were generated by multiplying the original feature maps and the corresponding weight. 


4. 分 类 网 络 模型 训练 


4.1 数据 归 一 化 

由 于 不 同 天 体 视 星 等 、 上 曝光 时 间 不 同 ， 观 测 到 的 光谱 流量 差异 巨大 。 为 使 分 类 网 络 模型 
更 加 和 鲁 棒 ,能够 适应 不 同 流量 差异 ,更 快 的 学 习 各 天 体 类 别 间 的 差异 , 我 们 对 分 类 网 络 的 输 
入 数据 进行 归 一 化 处 理 。 如 公式 〈1) 操作 : 


= 


F E= Finin #(1) 
F, 一 下 


其 中 下 为 原始 光谱 流量 数据 ,， Finwin 和 max 为 原始 光谱 流量 数据 的 最 小 值 和 最 大 值 。 光 谱 
归 一 化 前 后 如 图 6 Bras, 左边 的 是 3 条 光谱 归 一 化 前 的 流量 可 视 化 展示 , 右边 的 图 为 可 视 化 
后 的 流量 展示 。 归 一 化 前 不 同 光 谱 的 流量 不 在 同一 数量 级 ， 归 一 化 后 不 同 光 谱 的 流量 统一 。 
归 一 化 有 利于 卷 积 神经 网 络 更 加 快速 的 学 习 不 同 天 体 光 谱 间 的 特征 差异 , 使 神经 网 络 关 注 的 
点 不 包含 流量 因素 。 归 一 化 使 神经 网 络 的 训练 速度 加 快 、 精 度 提升 。 
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图 6 归 一 化 前 后 对 比 。 左 侧 为 归 一 化 前 的 光谱 ， 右 侧 为 归 一 化 后 的 光谱 

Fig.6 The specturm data before and after normalization. The left is the pre-normalized spectrum and the right is the normalized spectrum. 
4.2 数据 增强 

实验 数据 中 恒星 、 星 系 和 类 星体 三 类 天 体 所 占 比例 为 98.5:1.2:0.3， 数 据 极度 不 平衡 ， 恒 
星 类 型 远 多 于 其 他 两 类 , 所 占 比例 如 图 7 所 示 。 不 平衡 的 数据 会 使 卷 积 神经 网 络 的 分 类 效果 
下 降 ， 数 据 扩 充 是 非常 必要 的 。 我 们 通过 在 星系 、 类 星体 数据 上 增加 具有 具体 物理 意义 的 噪 
声 进 行 过 采样 扩充 数据 ， 从 而 增加 星系 、 类 星体 所 占 比例 ; 在 恒星 类 型 数据 上 进行 从 采样 减 
少 该 类 别 所 占 比 例 。 通 过 数据 扩充 ， 恒 星 、 星 系 和 类 星体 三 类 天 体 所 占 比例 平衡 到 1:1:1。 


RI 


201905.00065v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


qso 


galaxy 


star 


图 7 原始 数据 中 恒星 、 星 系 和 类 星体 数量 占 比 


Fig.7 The proportion of stars, galaxies and quasars in raw data. 

在 星系 、 类 星体 数据 增加 的 噪声 是 模拟 天 体 光 谱 在 产生 过 程 中 不 可 避免 的 噪声 情况 。 本 
实验 中 ， 我 们 模拟 了 三 种 噪声 : CCD 电子 噪声 、CCD 坏 像 元 和 宇宙 高 能 射线 。 
4.2.1 CCD 电子 噪声 

天 体 光谱 最 终 的 接收 端 是 CCD 相机 。 来 自 遥 远 天 体 的 光 经 过 色散 后 被 CCD 相机 接收 ， 
通过 光电 效应 产生 电子 ， 光 子 信息 以 电子 的 形式 被 记录 下 来 。 由 于 CCD 相机 在 工作 时 产生 
的 电子 也 会 被 自身 接收 ， 从 而 天 体 光 谱 产生 的 电子 与 CCD 自身 的 电子 会 同时 被 CCD 当做 
光子 信息 记录 , 由 此 产生 CCD 电子 噪声 .CCD 工作 带 来 的 电子 噪声 在 信 噪 比 越 低 时 越 明 显 。 
我 们 通过 生成 一 个 2600 列 的 高 斯 随机 数 模拟 CCD 电子 噪声 ， 随 后 加 在 归 一 化 后 的 天 体 光 
谱 上 进行 过 采样 扩充 数据 。 增 加 模拟 CCD 电子 噪声 前 、 后 的 光谱 可 视 化 如 图 8。 第 1、2、 
3 行 展 示 了 随机 选取 的 恒星 、 星 系 、 类 星体 天 体 类 型 光谱 ， 第 1、2 列 分 别 展示 了 对 应 的 天 
体 类 型 的 原始 光谱 和 模拟 了 CCD 电子 噪声 后 的 光谱 。 
4.2.2 CCD 坏 像 元 

CCD 相机 的 接受 端 难 免 出 现 故 障 ， 导 致 任何 强度 的 光子 信息 都 接受 不 到 。 在 光谱 上 的 表 
现 为 某 一 波段 的 流量 强度 为 0。 虽然 实际 情况 下 ， 这 种 存在 坏 像 元 影响 的 光谱 极 少 ， 但 为 了 
扩充 数据 , 并 使 分 类 模型 具有 更 强 的 泛 化 性 和 和 鲁 棒 性 ,我 们 通过 将 归 一 化 后 的 光谱 中 某 一 随 
机 波段 随机 长 度 的 流量 置 为 0 去 模仿 CCD 坏 像 元 。 增 加 模拟 CCD 坏 像 元 前 后 的 光谱 可 视 
化 如 图 8。 第 1、2、3 行 展 示 了 随机 选取 的 恒星 、 星 系 、 类 星体 天 体 类 型 光谱 ， 第 1、3 列 
分 别 展 示 了 对 应 的 天 体 类 型 的 原始 光谱 和 模拟 了 CCD 坏 像 元 后 的 光谱 。 
4.2.3 宇宙 高 能 射线 

在 CCD 相机 接受 光谱 信息 的 同时 ， 宇 宙 中 的 高 能 射线 会 有 几率 直接 打 在 CCD 相机 的 接 
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收 端 ， 使 得 某 一 随机 波长 处 的 流量 强度 极 高 。 同 样 的 ， 宇 宙 高 能 射线 对 光谱 数据 造成 干扰 的 
情况 不 多 , 但 为 了 扩充 数据 和 增加 分 类 模型 的 泛 化 性 和 和 鲁 棒 性 , 我 们 通过 将 归 一 化 后 的 光谱 
中 某 一 随机 波长 处 的 流量 置 为 1 去 模仿 宇宙 高 能 射线 。 增 加 模仿 宇宙 高 能 射线 前 后 的 光谱 可 
视 化 如 图 8。 第 1、2、3 行 展示 了 随机 选取 的 恒星 、 星 系 、 类 星体 天 体 类 型 光谱 ,第 1、4 
列 分 别 展示 了 对 应 的 天 体 类 型 的 原始 光谱 和 模拟 了 宇宙 高 能 射线 后 的 光谱 。 
4.2.4 综合 增强 

在 光谱 数据 的 实际 产生 过 程 中 ，CCD 电子 噪声 、CCD 坏 像 元 和 宇宙 高 能 射线 的 影响 是 
同时 存在 的 。 为 了 使 扩充 的 数据 更 加 贴近 真实 情况 , 我 们 对 光谱 数据 同时 增加 了 这 三 种 噪声 
的 模拟 .顺序 依次 是 : 原始 光谱 -> 模拟 CCD 电子 噪声 -> 模拟 宇宙 高 能 射线 -> 模拟 CCD 
坏 像 元 。 综 合 考虑 这 三 种 噪声 前 后 的 光谱 可 视 化 如 图 8。 第 1、2、3 行 展 示 了 随机 选取 的 恒 
星 、 星 系 、 类 星体 天 体 类 型 光谱 ， 第 1-5 列 分 别 展 示 了 对 应 的 天 体 类 型 的 原始 光谱 和 依次 模 
MT CCD 电子 噪声 、 宇 宙 高 能 射线 、CCD 坏 像 元 后 的 光谱 。 
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图 8 原始 数据 与 增强 后 数据 的 可 视 化 结果 。 第 1、2、3 行 表示 随机 选取 的 恒星 、 星 系 、 类 星体 天 体 类 型 光谱 。 第 1 列 为 原始 光 


谱 ， 第 2 列 为 模拟 了 CCD 电子 噪声 后 的 光谱 ， 第 3 列 为 模拟 了 CCD 坏 像 元 后 的 光谱 ， 第 4 列 为 模拟 了 宇宙 高 能 射线 后 的 光谱 ， 


paj 


第 5 列 为 依次 模拟 CCD 电子 噪声 、 宇 宙 高 能 射线 、CCD 坏 像 元 后 的 光谱 。 


Fig.8 Visualization of raw data and augmented data. Rows 1, 2 and 3 represent the spectra of randomly selected stars, galaxies and 
quasars, respectively. Columns 1, 2, 3, 4 and 5 represent the original spectrum, the spectrum adding the electronic noise of CCD, the 
spectrum adding the bad pixels of CCD, the spectrum adding the cosmic high-energy ray, and the spectrum adding the electronic noise of 


CCD, the cosmic high-energy ray and the bad pixels of CCD, respectively. 


4.3 模型 训练 
在 训练 卷 积 神经 网 络 时 使 用 Adam SKS BTS BES), AS SURVEY A ott K 
žit doss) 。 卷 积 神经 网 络 中 所 有 卷 积 层 权 重 采 用 He 式 均 匀 方 差 缩放 初始 化 (He uniform 


Hitt 
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variance scaling initializer) 外 。 神 经 网 络 共和 迭代 训练 60 次 ， 初 始 学 习 率 设置 为 0.01， 分 别 在 


第 10、30、50 次 时 减 小 10 倍 。 训 练 过 程 如 图 x， 训 练 的 前 10 次 ， 


于 学 习 率 很 大 ， 验 证 


集 上 的 loss 很 不 稳定 。 随 着 学 习 率 的 减 小 和 训练 的 增加 ， 训 练 集 和 测试 集 上 的 loss 都 趋 于 


稳定 ， 并 且慢 慢 变 小 。30 次 训练 后 验证 集 loss 几乎 不 再 下 降 。 为 了 防止 过 拟 合 ， 我 们 最 终 


保留 训练 了 35 次 的 权重 作为 最 终 的 模型 。 
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图 9 模型 训练 过 程 中 的 loss 变化 


Fig.9 Loss change progress during model training 


5， 分 类 网 络 模型 结果 与 关注 区 域 可 视 化 


— val 
—— train 


50 60 


我 们 将 验证 集 数 据 在 训练 好 的 卷 积 神经 网 络 上 进行 结果 测试 。 验 证 集 数 据 共 89877 条 ， 


恒星 、 星 系 和 类 星体 数量 占 比 与 原始 数据 一 致 。 
5.1 各 类 别 Fl 分 数 及 混淆 和 矩阵 


我 们 构建 的 卷 积 神经 网 络 在 验证 数据 进行 分 类 ， 分 类 结果 与 验证 数据 的 真实 标签 对 比 得 


到 每 一 类 的 精确 率 、 召 回 率 和 F 分 数 ， 如 表 1， 混 淆 矩阵 如 表 2. 
更 强 的 特征 ， 得 到 的 恒星 类 别 的 精确 率 、 召 回 率 和 Fl 分 数 均 最 高 ， 


恒星 类 别 天 体 光 谱 共 有 


Fl 分 数 达 到 了 0.9987. 


星系 与 类 星体 的 Fl 分 数 相近 ， 但 星系 类 型 的 召回 率 更 高 ， 类 星体 类 型 的 精确 率 更 高 。 


表 1 验证 数据 集 上 的 精确 率 、 召 回 率 和 F 分 数 


Tab.1 Precision, recall and F1-Score on validation data set 


Categories Precision Recall Fl-Score 
Star 0. 9995 0. 9980 0. 9987 
Galaxy 0. 8593 0. 9731 0.9127 
Quasar 0. 9231 0. 9065 0. 9147 
Average 0. 9258 0. 9592 0. 9420 
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对 于 本 文 的 卷 积 ; 
相似 性 ， 在 类 星体 与 恒星 


Es 


DenseNet HA KARAAT SOLE, TB 


在 出 现 了 欠 拟 合 问题 ， 精 确 率 、 召 回 率 和 Fl 分 数 都 显著 低 于 


的 光谱 中 ，20 条 预测 成 


百 星 ，6 条 预测 成 


PhP 可 以 看 出 ， 恒 星 类 型 预测 错误 的 光谱 
SRA, 星系 占 比 89.89%， 类 星体 占 比 10.11%; 星系 类 型 
百 星 、3 条 预测 成 了 类 星体 ， 恒 星 占 比 89.29%， 类 星体 占 比 10.71%。 类 星体 类 型 预测 
星系 ， 恒 星 占 比 76.92%， 星 系 占 比 23.08%. 


经 网 络 ， 同 时 考虑 恒 


F, 160 条 预测 成 了 星系 、18 条 预测 成 
晶 预 测 错误 的 光谱 中 ，25 条 预测 


恒星 和 星系 共有 更 高 的 


星 、 星 系 和 类 星体 三 种 类 型 ， 


星系 相似 性 的 比较 


PF， 类 星体 更 加 相似 于 恒星 。 


表 2 验证 数据 集 上 的 混淆 矩阵 


Tab.2 Confusion matrix on validation data set 


Prediction 
Star Galaxy Quasar 
Star 88379 160 18 
Reference Galaxy 25 1014 3 
Quasar 20 252 


我 们 将 本 文 模型 的 分 类 效果 与 传统 机 器 神经 网 络 方法 


星 、 星系 、 类 星体 的 习 


NI 


s REA R A RIAR E 
均 指标 如 表 3。 传 统 神经 网 络 


He AIA, 1 


E 是 由 于 深层 网 络 


的 梯度 弥散 或 梯度 爆炸 所 致 。 深 度 信 念 网 络 和 DenseNet 不 同 程度 的 解决 了 梯度 弥散 或 梯度 
爆炸 问题 ， 精 确 率 、 召 回 率 和 Fl 分 数 有 了 明显 提升 。 本 文 方法 在 DenseNet 基础 上 进一步 提 
升 了 各 方面 指标 。 


表 3 验证 数据 集 上 各 方法 平均 分 类 指标 


Tab.1 Average precision, recall and Fl-Score of various methods on validation data set 


methods 


传统 神经 网 络 


网 络 层 数 


4 


Precision 


0. 4260 


Recall 


0. 2693 


Fl-Score 


0. 3299 
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深度 信念 网 络 4 0. 8166 0. 8437 0. 8299 
DenseNet 36 0. 9013 0. 9294 0. 9151 
本 文 方法 36 0. 9258 0. 9592 0. 9420 
5.2 关注 区 域 可 视 化 


卷 积 神经 网 络 拟 合 的 光谱 数据 与 天 体 类 型 间 的 关系 是 自主 学 习 的 ， 而 天 体 类 别 是 根据 其 
物理 意义 进行 划分 的 。 我 们 希望 神经 网 络 自主 学 习 到 的 是 天 体 反映 在 光谱 上 具有 物理 意义 的 
谱 线 特征 , 这样 的 神经 网 络 具 有 更 高 的 可 解释 性 。 为 了 检验 本 文 训练 得 到 的 模型 是 否 真正 学 
到 了 可 以 反映 天 体 类 型 的 特征 谱 线 ， 我 们 使 用 Class Activation Mapping!” (CAM) 方法 对 
神经 网 络 模型 在 预测 分 类 时 关注 的 重点 区 域 进行 了 可 视 化 。CAM 是 一 种 神经 网 络 关 注 区 域 
可 视 化 方法 , 如 图 10, 具体 流程 为 : 1) 获取 神经 网 络 预测 类 别 Cs 2) 获取 全 局 池 化 CGAP) 
后 全 连接 层 到 类 别 C 的 权重 w; 3) 使 用 权重 w 加 权 求 和 全 局 池 化 前 的 所 有 特征 图 ， 得 到 求 
和 后 的 特征 图 M; 4) 归 一 化 M 并 插值 到 原 图 大 小 。 
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Class Activation Mapping 


= E *wi + D *w2 + Tb. *w3 + i * w4 


图 10 Class Activation Mapping 

Fig. 10 Class Activation Mapping 
我 们 随机 选择 分 类 正确 的 恒星 、 星 系 、 类 星体 和 分 类 错误 的 光谱 ， 将 神经 网 络 在 不 同 波 
段 处 关注 的 强 弱 展 示 在 原始 光谱 上 ， 如 图 11。 第 1-6 行 分 别 展示 了 2 条 随机 选择 的 分 类 下 
确 的 恒星 、 星 系 和 类 星体 光谱 及 神经 网 络 关 注 的 区 域 ， 第 7-10 行 展示 了 分 类 错误 的 光谱 及 
神经 网 络 关注 的 区 域 。 光 谱 中 越 黄 、 越 亮 的 波段 ， 代 表 神 经 网 络 更 加 关注 这 些 区 域 在 分 类 时 
的 贡献 ; 越 蓝 、 越 暗 的 波段 , 代表 神经 网 络 更 加 忽视 这 些 区 域 在 分 类 时 的 贡献 。 恒 星 与 星系 、 
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类 星体 在 光谱 上 的 显著 差异 , 是 其 具有 较 强 的 氨 元 素 的 吸收 线 , 这 也 是 恒星 大 气相 对 于 星系 、 
类 星体 独 有 的 特点 。 神 经 网 络 在 对 第 1、2 行 的 两 条 恒星 光谱 分 类 时 ， 重 点 关注 了 氢 元 素 的 
吸收 线 ， 和 物理 规律 是 一 致 的 。 神 经 网 络 在 对 第 3-6 行 的 星系 、 类 星体 分 类 时 ， 即 使 存在 一 
定 红 移 ， 模 型 也 重点 关注 了 特定 元 素 的 发 射线 、 发 射 带 。 神 经 网 络 在 第 7-10 行 错 误 分 类 时 
关注 区 域 相 对 弥散 , 关键 的 特征 谱 线 因为 信 品 比 低 等 原因 在 光谱 中 不 显著 , 神经 网 络 找 不 到 
关键 的 特征 谱 线 。 本 文 训练 的 神经 网 络 模型 在 进行 分 类 时 , 可 以 定位 到 上 共有 其 体 物理 意义 的 
特征 谱 线 。 对 于 分 类 结果 ， 该 模型 具有 更 强 的 可 解释 性 。 
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real: galaxy -> predict: star 
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图 11 关注 区 域 可 视 化 


Fig.11 The visualization results of the regions of interest 


6. 总 结 


本 文 基于 在 计算 机 视觉 领域 广泛 应 用 的 DenseNet 网 络 结构 ,针对 光谱 数据 进行 修改 , E 
立 了 适用 于 光谱 数据 的 一 维 卷 积 神经 网 络 模 型 解决 天 体 光 谱 数 据 分 类 任务 。 通 过 模拟 CCD 
昌 子 噪声 、CCD 坏 像 元 和 宇宙 高 能 射线 平衡 数据 中 不 同 天 体 类 型 的 数量 。 本 文 的 卷 积 神经 
网 络 模型 在 随机 选取 的 89877 条 光谱 测试 中 ， 人 恒星、 星系、 类 星体 的 F1 分 数 分 别 为 0.9987、 
0.9127、0.9147。 为 了 检验 该 卷 积 神经 网 络 模型 的 可 解释 性 ， 我 们 对 神经 网 络 模型 在 分 类 时 
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关注 的 区 域 进行 了 可 视 化 ,结果 表明 本 文 的 卷 积 神经 网 络 可 以 自主 学 习 到 各 类 天 体 对 应 的 特 
ERER, 具有 较 强 的 可 解释 性 。 本 方法 被 用 于 阿里 云天 池 天 文 数据 挖 气 大 赛 一 一 天 体 光 谱 知 
能 分 类 ， 并 在 843 支 参赛 队伍 的 3 次 数据 评比 中 获得 了 2 次 第 一 、1 次 第 三 的 成 绩 ， 证 明了 该 模 
型 在 保证 分 类 精度 的 同时 具有 极 强 的 鲁 棒 性 、 泛 化 性 ， 适 用 于 光谱 的 自动 分 类 。 
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Classification of astronomical spectra based on 


DenseNet 


Wang Qixun’, Zhao Gang”, Fan Zhou’ 
(1, Key Laboratory of Optical Astronomy, National Astronomical Observatories, Chinese Academy of Sciences, Beijing 
100101) 

(2, School of Astronomy and Space Science, University of Chinese Academy of Sciences, Beijing 100049) 
Abstract: Intelligent processing of astronomical spectra data is gradually shifting from traditional 
machine learning to deep learning, which mainly used the technology of computer vision. Based 
on DenseNet network structure, which is widely used in the field of computer vision, a 
one-dimensional convolution neural network model for spectral data is established to solve the 
classification task of celestial spectral data. The F1 scores of stars, galaxies and quasars are 0.9987, 
0.9127 and 0.9147 respectively in the validated data set. The visualization results of the regions of 
interest in spectral classification show that the proposed model can learn the characteristic spectral 
lines of celestial bodies which has interpretability. This method is applied to the intelligent 
classification of celestial spectrum in Alibaba Cloud Tianchi Astronomical Data Mining 
Competition. We won the first prize two times and the third prize one time in 843 teams in three 
data evaluations, and the result proves that the model has robustness and generalization, and is 


suitable for automatic classification of spectra. 


Key words: convolutional neural network; classification of spectra; data mining 


